iT邦幫忙

2022 iThome 鐵人賽

DAY 5
4
AI & Data

OH~ AI 原來如此,互助就此開始!系列 第 5

Day 4. AI 趨勢 - 知識表示

  • 分享至 

  • xImage
  •  

現在越來越多商家提供24小時的聊天機器人服務來取代傳統客服,但是你知道語音助理 Siri 的原型早在1964年就出現了嗎?而聊天機器人可以應用在專家系統上,其中醫療領域的專家系統對於協助醫療診斷提供了相當大的貢獻。

聊天機器人(Chatbot)

一種電腦程式,可以針對特定的規則和順序做對話處理。實際上電腦並沒有真的理解對話內容。

ELIZA

最早的聊天機器人,1964~1966年由麻省理工學院的 Joseph Weizenbaum 開發。
主要是偽裝成心理醫師來和人們對話,也是最早嘗試通過圖靈測試的程式之一

以下是當時的對話節錄:

ELISA:你有什麼困擾嗎
你:男人都一樣
ELISA:關於這個你有什麼想法呢
你:他們總是讓我們很焦躁
ELISA:你可以舉出具體的例子嗎
你:他說我常常很沮喪
ELISA:我很遺憾聽到你很沮喪
你:的確我不開心阿
ELISA:可以告訴我你為什麼不開心嗎

ELIZA 利用對手的發言,如果內容符合預先設定的某種規則,再使用該規則來回答既定的答案,屬於規則式(Rule-Based)的推理, 並沒有用到什麼知識。
但是你會感覺到像是和真的人在對話一樣的錯覺,這種擬人化的錯覺叫做 ELIZA 效果(ELIZA Effect)

比較簡單的做法如下(使用 if-then 規則)

if(假如) 對方輸入 xxx
then(那麼)隨機選擇下面一個做回應

  • 關於 xxx 你有什麼想法
  • xxx 有更多例子嗎
  • 為什麼你 xxx 呢

2022年6月 google 研究員聲稱「AI 有意識和靈魂」,就是產生了 ELIZA Effect,覺得聊天機器人和真人一樣。

PARRY

另一個有名的聊天機器人,1972年由史丹佛大學開發。
PARRY 模擬了偏執型精神分裂症患者,因此交談時表現出更人性化,更有態度。有趣的是,人們有試著讓 PARRY(偏執狂)和 ELIZA(醫生)交談過幾次。對話內容可以參考著名的 RFC 439 紀錄。(PARRY 碰上醫生)

專家系統(Expert System)

使用某個領域的知識庫,來模擬該領域專家做決策的系統,由兩個子系統構成。

  • 知識庫(Knowledge base):某個領域的專門知識(事實)
  • 推理引擎(Inference engine):規則式(Rule-Based)推理 ,使用 if-then 規則 ,如果知識庫的某個事實成立則從已知事實去詢問相關的新事實是否成立

MYCIN

早期知名的專家系統。1974年由史丹佛大學開發,用來識別血液中的細菌,並推薦抗生素。MYCIN 使用簡單的推理引擎和約 600 個規則的知識庫。如同醫生問診一樣,詢問一連串有關病症的問題,最後給出可能性最高的診斷結果。診斷結果約有 65% 準確率,儘管比專門醫師的 80% 低,但比一些非專門的診所醫生的判斷還高。

對話過程是這樣的:

Q:從哪取得細菌的
A:血
Q:形狀是桿狀,球狀或其他
A:桿狀
Q:它的革蘭氏染色是?
A:陰性
Q:是有氧生長嗎
A:是的

根據對話的結果,if 以下狀況成立,then 判定可能是 綠膿桿菌(Pseudomonas )

  • 細菌在血液中
  • 細菌是桿狀
  • 革蘭氏染色呈陰性
  • 細菌是有氧生長

而在 MYCIN 的前幾年就有世界第一個專家系統 Dendral 誕生。1965~1968年同樣由史丹佛大學開發,是用來判斷物質其分子結構的專家系統。

記得大學通識課程有一門課是講專家系統的,那時候是試著寫感冒診斷的程式。結果診斷效果很差,因為感冒和其他症狀太相似了…

專家系統獲得知識的困難處

知識可以分成兩種:

  • 顯性知識(Explicit knowledge)
    通過語言記在文件或書籍,影像的聲音等可傳達知識給他人,例如百科全書或教科書等。「台北在台灣」就是一個顯性知識。

  • 隱性知識(Tacit knowledge)
    專家的經驗,思考,技術,直覺等,較難靠外在媒介傳達給他人共享知識。像是騎腳踏車,游泳等,或是傳統的學徒制,都不是透過語言而是透過觀察和模仿來學習。

隱性知識目前大多是透過訪談(Interview)來轉換成顯性知識。

為了建構知識庫,可以從文件、案例或專家身上來取得知識。文件或案例屬於顯性知識容易取得。但是專家系統所需的高度知識是只有專家才擁有,而專家的知識很多都是靠經驗經年累月而來的,這樣的經驗越多越難轉換成顯性知識記錄下來。另外獲得的知識越多,規則成千上萬,規則之間可能會有矛盾或前後不一,知識庫的維護管理變成非常困難。因此針對知識的共有和再利用,以及電腦該如何處理知識的方法論就被提出了。

本體論(Ontology)

An Ontology is a specification of a conceptualization.- Tom Gruber

本體論是一種概念的規範,簡單來說你可以把它當成是電腦可以理解的字典或是知識用的規格書。電腦對於知識有了統一的規格,就可以分享和再利用。

就像我們手機的充電線根據手機品牌各有不同的接頭,所以不能共用同一條充電線,但是這個規格歐盟已經統一採用 USB 3.0 這種接頭,下一代的蘋果手機(NOT iPhone 14)充電線可能就需要遵照這個統一的規格,以後充電線就能共用。

語意網路(Semantic Network)

語意網路是用來表現本體論的一種方式。是一個表示概念之間語義關係的圖形,概念和概念間用箭頭表示上下關係。語意關係用 is-a 和 part-of 來表示。

https://ithelp.ithome.com.tw/upload/images/20220816/20150622AAvZMWi2Gi.jpg

  • is-a
    是的關係,男生是人類,而人類是動物,所以男生是動物。
    is-a 符合遞移律(a=b,b=c,則 a=c)。
  • part-of
    一部分的關係,四肢是我的一部分,我是公司員工的一部分,但四肢不是公司員工的一部分。所以 part-of 沒有符合遞移律。

語意網路對人類來說很好理解,而概念和概念之間的連結本身是一種圖形,可以使用圖像算法(還記得搜尋樹嗎),對於知識的搜尋也變得容易。

本體論還可以分為兩種:

  • 重量級本體論(Heavyweight Ontology)
    藉由人類的思考逐一將知識記述下來。最具代表性的就是 Cyc 專案,一個包攬一切常識的專家系統,比如說花是植物,川普是美國總統之一等常識。這個專案從1984年持續進行到現在的今天,但是人類的常識一直在增加,這個專案可能沒有完成的一天。
  • 輕量級本體論(Lightweight Ontology
    重視效率,由電腦讀取資料,自動找出概念和概念的關聯性。例如使用下面的網頁探勘技術。
    • 語意網(Semantic Web
      網路上的文件如網頁,添加能夠被電腦所理解的語意(例如 XML 這種標記式語言),從而使整個網路成為一個通用的資訊交換平台。
    • 連結資料(Linked Data
      通過網頁的可連結 URI (例如網址) 來連接 Web 中各類資源。

第二次 AI 浪潮的成果

IBM 開發的華生(Watson)在2011年美國的機智問答節目中擊敗人類。將維基百科的資訊使用輕量級本體論,針對問題中的關鍵字,快速檢索出有相關性的答案。

補充資料

How a Google Employee Fell for the Eliza Effect

立即複習

  • 世界第一個聊天機器人是?感覺到像是和真的人在對話一樣的錯覺叫做?
  • 世界第一個專家系統是 MYCIN 還是 Dendral?
  • 知識獲得的困難之一是因為隱性知識難以獲得,目前大多採取何種方式轉換成顯性知識?
  • 語意網路是表現本體論的一種方式,其中有哪兩種語意關係?哪個符合遞移率?
  • Watson 是採用重量級本體論還是輕量級本體論來取得維基百科的資訊?

參考資料


上一篇
Day 3. AI 趨勢 - 搜尋和邏輯推理
下一篇
Day 5. AI 趨勢 - 機器學習和深度學習
系列文
OH~ AI 原來如此,互助就此開始!31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言